تشخیص جمله و استخراج جملات با معنی از متن فارسی با استفاده از ویژگی های دستوری

پایان نامه
چکیده

امروزه با گسترش کاربرد کامپیوتر، نیاز به استفاده از توانایی های غیر قابل چشم پوشی آن، در حوزه زبان شناسی به شدت احساس می شود.حوزه های پردازش زبان طبیعی و زبان شناسی رایانه ای به تلاش برای ماشینی کردن فرآیند زبان شناسی سنتی می پردازند.هدف اصلی در پردازش زبان طبیعی، ایجاد تئوری های محاسباتی از زبان،با استفاده از الگوریتم ها و ساختارهای داده ای موجود در علوم کامپیوتر است. بدیهی است که در راستای تحقق این هدف، نیاز به دانشی وسیع از زبان است و علاوه بر محققان علوم کامپیوتر ، نیاز به دانش زبان شناسان نیز در این حوزه می باشد. این پایان نامه به کمک ابزارهای زبانی دستور فارسی و اطلاعات آماری و نیز به کارگیری درخت تصمیم گیری سعی در ارائه روشی دارد که به کمک آن بخشی از نیازهای حوزه پردازش زبان طبیعی را پاسخ دهد.از جمله تحقیقاتی که با بکارگیری این ابزار در این پایان نامه انجام شده است، تعیین محدوده جملات فارسی می باشد که در آن، محدوده جملات که شامل ابتدا، انتها، وسط و ابتدا/ انتها می باشد به صورت خودکار شناسایی می شوند. هم چنین از این ابزار در شناسایی انواعی از کلمات مرکب که شامل اسم و صفت مرکب می باشنداستفاده شده است. زیرا وجود کلمات مرکب در جملات و پایین بودن دقت شناسایی این کلمات منجر به تولید جملاتی می شود که گاه به لحاظ دستوری و گاه به لحاظ معنایی نادرست می باشند. بنابراین یکی از راه حل های استخراج جملات بامعنی ، برطرف کردن این معضل می باشد. کلماتمرکب به صورت ترکیبی از دو یا چند کلمه با معنی مجزا در متن ظاهر می شوند و همین امر شناسایی آنها را به عنوان یک کلمه واحد، کمی مشکل می سازد. این روش قابل تعمیم به انواع دیگر کلمات مرکب از جمله حروف ربط و قید نیز می باشد. نتایج بدست آمده در هر دو تحقیق نشان دهنده کارا بودن این روش می باشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

The effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2

كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...

متن کامل

The Study of Stressful Factors in Clinical Education for Nursing Students Studying in Nursing and Midwifery College in Khorramabad

کچ هدي پ شي مز هني فده و : شزومآ لاب يني شخب ساسا ي شزومآ مهم و راتسرپ ي تسا . و هنوگ ره دوج لکشم ي شزومآ رد لاب يني ، آراک يي هدزاب و ا ني شزومآ زا شخب راچد ار لکشم م ي دنک . فده اب رضاح شهوژپ سررب ي لماوع سرتسا از ي شزومآ لاب يني رد وجشناد ناي راتسرپ ي هدکشناد راتسرپ ي و يامام ي ماـجنا داـبآ مرـخ تسا هتفرگ . شور و داوم راک : رضاح هعلاطم کي هعلاطم صوت يفي عطقم ي تسا . د...

متن کامل

استخراج خودکار جملات هم‌تراز انگلیسی-فارسی از متون مقایسه‌ای با بهره‌برداری از اطلاعات نحوی

پیکره‌های موازی همواره از غنی‌ترین منابع در مباحث پردازش زبان طبیعی محسوب می‌شوند.  این نوع پیکره‌ها شامل متون ترجمه‌شدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم‌ترازشده‌اند. علیرغم کاربرد فراوان این نوع پیکره‌ها در مطالعات مختلف از جمله پژوهش­های زبانی، ترجمة ماشینی آماری و سامانه‌های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره‌های موازی مو...

متن کامل

تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها

Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...

متن کامل

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

بهبود دقت در تشخیص احساسات با استفاده از سیگنال‌های EEG با نوآوری در ترکیب استخراج ویژگی

مقدمه: از آنجا که احساسات نقش مهمی در زندگی روزمره انسان بازی می‌کند، ایجاد روشی هوشمند جهت بهبود قابلیت تشخیص احساسات از سیگنال الکتروانفسالوگرافی (EEG)‌، مبتنی بر تکنیک‌های پردازش سیگنال، ضروری به نظر می رسد. به‌علاوه، استفاده از طبقه‌بند ماشین بردار پشتیبان بهینه شده با الگوریتم تکاملی ژنتیک، از نوآوری‌های این پژوهش در بخش طبقه‌بندی می‌باشد. روش: روش پیشنهادی با تمرکز بر روی استخراج و طبقه‌ب...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023